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Dzfefzon 



Verfahren und Vorrichtung zur Unterdriickung von Rauschen und 

Echos 



Die Erfindung betrifft ein Verfahren zur Rausch- und Echounterdriickung in 
Signalen, z.B. Bild- oder Sprachsignalen. Die Erfindung kann zum Beispiel in 
einer eine Freisprecheinrichtung aufweisenden Fernsprecheinrichtung, einem 
Bildtelefon oder einem medizinischen bildgebenden Gerat eingesetzt werden. 
Die Erfindung betrifft desweiteren eine Vorrichtung zur Ausfiihrung dieses 
Verfahrens. 

Bei der Aufnahmen und der Ubertragung von Bild- oder Sprachsignalen wer- 
den diese Signale oft durch Rauschen und bei der Ubertragung iiber Lei- 
tungen oft auch durch (Leitungs-) Echos gestort. Bei Sprachsignalen und 
der Verwendung einer Freisprecheinrichtung kommen desweiteren auch noch 
akustische Echos hinzu. Zur Verbesserung der subjektiven Qualitat und der 
Verstandlichkeit bei Sprache, bzw. der Scharfe bei Bildern, konnen diese 
Storungen mit einer Storgerauschreduktion und gegebenenfalls einer Echo- 
reduktionsvorrichtung, z.B. einem Echokompensator oder einer Pegelwaage, 
reduziert werden. 

Die Storgerauschreduktion wird meist mit einem Verfahren der Spektralen 
Gewichtung in einem transformierten Bereich, z.B. nach einer Fourier Trans- 
formation oder einer Diskreten Cosinus- Transformation ausgefiihrt. Verfah- 
ren fur die Verbesserung verrauschter Sprachsignale sind z.B. in Y. Ephraim 
and D. Malah, 'Speech Enhancement Using a Minimum Mean-Square Error 
Short-Time Spectral Amplitude Estimator', IEEE Trans. Acoustics, Speech 
and Signal Processing, Vol. 32, pp. 1109-1121, 1984, und in D. Malah, R.V. 
Cox and A.J. Accardi, 'Tracking Speech-Presence Uncertainty to Improve 
Speech Enhancement in Non-Stationary Noise Environments', Proc. IEEE 
Intl. Cpnf. Acoustics, Speech, Signal Processing (ICASSP), 1999, beschrie- 




ben. Fur die Reduktion von Rauschen in Bildsignalen sind ahnliche Verfah- 
ren bekannt, siehe z.B. J.S. Lim, Image Restoration by Short Space Spectral 
Subtraction', IEEE Trans. Acoustic, Speech, and Signal Proa, Vol. 28, pp. 
191-197, 1980 oder T. Aach and D. Kunz, Spectral Estimation Filters for Noi- 
se Reduction in X-Ray Fluoroscopy Imaging', Proc. EUSIPCO, pp. 571-574, 
1996. 

Die Reduktion von akustischen Echos oder Leitungsechos wird meist mit 
einem Echokompensator, einer Pegelwaage, einem Center Clipper oder be- 
liebigen Kombinationen dieser Verfahren durchgefuhrt. Erne Ubersicht zum 
Stand der Technik im Hinblick auf Sprachsignale ist z.B. in E. Hansler, 
'The Hands- Free Telephone Problem - An Annotated Bibliography', Signal 
Processing, Vol. 27, pp. 259-271, 1992, und in E. Hansler, 'The Hands- 
Free Telephone Problem - An Annotated Bibliography Update, Annales des 
Telecommunication, Vol. 49, No. 7-8, pp. 360-367, 1994, gegeben. 

Seit einiger Zeit sind auch Verfahren bekannt, die Rauschen und Echos ge- 
meinsam reduzieren. Ein solches Verfahren ist z.B. in S. Gustafsson et.al.: 
Combined Acoustic Echo Control and Noise Reduction for Hands-free Tele- 
phony, Signal Processing, vol. 64. pp. 21-32, 1998, beschrieben. Diese Verfah- 
ren bestehen meist aus der Kombination eines Echokompensators mit einem 
die Restechos und das Rauschen verminderndem Filter. 

Der Nachteil der bisher bekannten Verfahren besteht darin, dass sie entweder 
das Nutzsignal (z.B. Sprache) zu stark verzerren, oder aber das verbleibende 
Hintergrundgerausch bei Sprache unnatiirlich klingt oder stark fluktuiert. In 
der Bildverarbeitung liegen die Probleme in Blockeffekten, Konstrastverlu- 
sten oder aber unnatiirlich wirkende Hintergrundmustern ('gratings'). 

Die Aufgabe der Erfindung besteht deshalb darin, ein Verfahren und eine 
Vorrichtung anzugeben, die eine wirkungsvolle Rausch- und/oder Echore- 
duktion ermoglicht, und dabei nur zu minimalen Verzerrungen im Nutzsignal 
und unwesentlichen Fluktuationen im Reststorsignal fiihrt. 

Diese Aufgabe wird durch ein Verfahren gelost, dass die Merkmale des An- 
spruchs 1 aufweist. 

Das Verfahren beruht darauf, dass das gestorte Signal Nutzsignal, Rauschen 
und die evtl. auftretenden Echosignale nicht zu alien Zeitpunkten oder in 
alien Bildpunkten oder Bildregionen enthalt und daher der Einsatz unter- 
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schiedlicher Signalschatzer oder Signalfilter zu unterschiedlichen Zeitpunkten 
oder bei unterschiedlichen Bildpunkten von Vorteil ist. Beispielsweise ist das 
Nutzsignal nur dann in dem gestorten Signal enthalten, wenn tatsachlich ge- 
rade Bildinformation oder Sprache iibertragen wird. In gleicher Weise hangt 
das Auftreten von Echos von der Aktivitat der Signalquellen ab. 

Erfindungsgemass werden nun fur die verschiedenen Falle, z.B. 'Bild- oder 
Sprachinformation im Signal vorhanden', 'Rauschen im Signal vorhanden 5 , 
'Echos im Signal vorhanden', und beliebigen Kombinationen derselben und 
je nach Pegel der Signal relativ zueinander, unterschiedliche Signalschatzer 
oder Signalfilter eingesetzt, wobei auch beliebige lineare oder nicht-lineare 
Kombinationen dieser Signalschatzer oder Signalfilter moglich sind. Auf diese 
Weise wird das Nutzsignal aus dem gestorten Signal mit einem der jeweiligen 
Situation angepassten Schatzer oder Filter extrahiert. Das Umschalten dieser 
Schatzer oder Filter oder ihre relative Gewichtung bei einer Kombination 
wird mit Hilfe von Variablen bestimmt, die aus dem gestorten Signal oder 
aus anderen Signalquellen bestimmt werden. 

Fig. 1 zeigt die prinzipielle Anordnung. z(k) bezeichnet ein Sprach- oder 
Bildsignal und *$(h) das von Rauschstorungen oder Echos befreite Signal. 
x(k) bezeichnet ein moglicherweise vorhandenes externes Steuersignal. Das 
gestorte Signal z{k) wird nun N Signalschatzern oder Signalfiltern Si, 5 2 , 
S# zugefuhrt. Eine Kombinationseinheit K, die das Eingangssignal z(k) 
und das evtl. vorhandenen externen Steuersignal x(k) verarbeitet, steuert 
die Auswahl und/oder die Kombination der von den Signalschatzern oder 
Signalfiltern Si, 52, Sjv gelieferten Signale und bildet das von Rauschen 
und Echos befreite Signal 7 (k). 

Zur Bestimmung der Schatzer und der relativen Gewichtung dieser Schatzer 
zueinander sind besonders statistische Verfahren geeignet. Insbesondere kann 
die Auswahl eines oder mehrerer zum einem bestimmten Zeitpunkt oder in 
einem bestimmten Bildpunkt geeigneter Signalschatzer oder Signalfilter aus 
den geschatzten Wahrscheinlichkeiten fur das Vorhandensein der Nutzsignal, 
Rausch- oder Echosignalanteile im gestorten Signal gesteuert werden. Nach- 
folgend wird ein Ausfiihrungsbeispiel eines solchen Schatzverfahrens fur den 
Einsatz in einer Freisprecheinrichtung angegeben. 

Fig. 2 zeigt die Kombination aus einem Echokompensator und einem adap- 
tiven Nachfilter. Das Nachfilter ist im Frequenzbereich, unter Verwendung 
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einer Diskreten Fouriertransformation (DFT), einer spektralen Gewichtung, 
und einer 'overlap/add'-Signalsynthese implementiert. Das Nachfilter setzt 
sich, wie im folgenden gezeigt wird, aus zwei Teilfiltern und einer adaptiven 
Kombinationseinheit zusammen. 

Wir betrachten die abgetasteten und bandbegrenzten Signale x(z), y(i), z(i) 
und ?(z) wobei i den diskreten Zeitindex bezeichnet. x(i) ist das Signal 
des fernen Sprechers und y(i) ist das Mikrophonsignal welches sich aus ei- 
nem Sprachsignal s(i), einem Rauschen n(z), und einem Echosignal e(z), 
y(i) = s(i) + n(i) +e(i). zusammensetzt. Das echokompensierte Signal z{i) 
ist das Mikrofonsignal minus dem vom ^Compensator geschatzten Echo e(z), 
z{i) = y{i) — e(i) = s(i) + n(i) H~ e(i). e(i) bezeichnet das Restecho nach 
der Kompensation. Wir nehmen ferner an, dass die Signale x(i), and 
n(i) statistisch unabhangig sind. Das durch Rauschen und Restechos gestorte 
kompensierte Signal z(i) wird unter Verwendung einer Fensterfunktion h(i) 
in den Frequenzbereich transformiert, indem ein Rahmen von L aufeinander- 
folgende Abtastwerte von z(i) zusammengefasst werden, dieser Rahmen mit 
der Fensterfunktion gewichtet wird und eine DFT der Lange L berechnet 
wird. Vor der nachsten DFT Berechnung wird das Fenster um R Abtast- 
werte auf dem Eingangssignal verschoben. Die DFT Analyse mit gleitendem 
Fenster resultiert in einer Menge von Frequenzbereichssignalen, die auch mit 



angegeben werden konnen, wobei A ein unterabgetasteter Zeitbereichsindex, 
A G Z, und k ein Frequenzindex. k 6 {0,1..., L — 1}, angibt, und letzterer 
zur normierten Mittenfrequenz der DFT-Bander mit Q k by Q k = k2n/L in 
Beziehung steht. Typischerweise wird eine Abtastrate von f A = 8000 Hz und 
eine DFT-Lange von L = 2R = 256 verwendet. 

Ebenso werden die Fourierkoeffizienten aller anderen Signale des &ten Fre- 
quenzindex mit 

• Sk = A k exp(jak) (ungestorte nahe Sprache), 

• Y]fe = R k exp(ji9jt) (gestorte nahe Sprache), 

• X k = B k exp(j0 k ) (feme Sprache), 

• Z k — D k exp(j£ k ) (kompensiertes Signal), 



L-l 




(i) 



M=0 



• Sk = A k exp(ja k ) (entstortes Signal). 

angegeben, wobei der Klarheit halber der Zeitindex A unterdriickt wurde. 

Die Verteilungsdichtefunktionen der nahen und der fernen Sprache konnen 
mit Ps(A kl a k ), bzw. p x {B k ,(3 k ), angegeben werden: 

P$ (A k ,a k ) = P^Jp^ (2) 
P*{B k ,(3 k ) = P(H l xk )p x (B k ,p k \H l x ) + P(H° xk )6(B k ,f3 k ) (3) 

wobei P(Hl k ) und P(H xk ) fur die Wahrscheinlichkeiten, dass nahe bzw. feme 
Sprache vorliegt, stehen und P(H° k ) = l-P(H} k )) und P(H° k ) = l-P(H xk ) 
gilt. S(-) bezeichnet die Dirac-Funktion. 

Es wird nun die Kostenfunktion 



<C= f {P(H°)P(H^)A^p(Z\H^ t H^) 

+ P{Hl)P(Hl) fffftf- ^) 2 P{Z\A, a, B, 0) 

■ p s (A, a\H})p x (B ; /3\H x )dAdadBdf3 (4) 
+ P(H°)P(Hl)A*p(Z\H°,H x ) 

+ P{H))P{Hl) 

■ p(Z\A, a, H° x )p 5 {A, a \H])dAda}dZ 

minimiert, wobei A die spektralen Amplituden des geschatzten nahen Signals 
bezeichnen, die wiederum eine Funktion von Z sind. Die Losung ist durch 

~_ P{H))P{Hl)p{Z\HlHl) s ^ 

(5) 



gegeben, mit 



, P[H])P{H*)p{Z\HlH*) e 
+ ^ S * 



Sx=E{A\Z,HlHZl (6) 

S 2 = E{A\Z,H],H° X } (7) 



gekennzeichnet, dass es sich bei den Echos um akustische Echos handelt; 

11. Ein Verfahren nach einem der vorangegangenen Anspriiche, dadurch 
gekennzeichnet, dass es sich bei den Echos um Leitungsechos handelt; 

12. Ein Verfahren nach einem der vorangegangenen Anspriiche, dadurch 
gekennzeichnet, dass es sich bei den Echos um Echos in einer Mess- oder 
Signalaufnahmevorrichtung handelt; 

13. Ein Verfahren nach einem der vorangegangenen Anspriiche, dadurch 
gekennzeichnet, dass die Echos iiberwiegend von einem Echokompensator 
reduziert werden und die Restechos und das Rauschen von nachgeschalteten 
Signalschatzern oder Signalfiltern reduziert werden. 

14. Ein Verfahren nach einem der vorangegangenen Anspriiche, dadurch ge- 
kennzeichnet, dass die Signalschatzer oder Signalfilter in einem transfor- 
mierten Bereich, z.B. im Bereich einer Fourier- oder Diskreten Cosinustrans- 
formation, berechnet werden; 

15. Ein Verfahren nach einem der vorangegangenen Anspriiche, dadurch 
gekennzeichnet, dass die Signaltransformation eine diskrete Fouriertrans- 
formation ist; 

16. Ein Verfahren nach einem der vorangegangenen Anspriiche, dadurch 
gekennzeichnet, dass die Signaltransformation in Frequenzrichtung nach 
einer Bark oder Mel Skala ausgefiihrt wird; 

17. Ein Verfahren nach einem der vorangegangenen Anspriiche, dadurch ge- 
kennzeichnet, dass die Grossen zur Steuerung der Signalkombination aus 
den Wahrscheinlichkeiten fur das Vorhandensein des Signals, des Rauschens 
und des Echos berechnet werden; 

18. Ein Verfahren nach einem der vorangegangenen Anspriiche, dadurch 
gekennzeichnet, dass die Signalschatzer oder Signalfilter nach dem Prinzip 
der kleinsten Fehlerquadrate berechnet werden; 

19. Ein Verfahren nach einem der vorangegangenen Anspriiche, dadurch ge- 
kennzeichnet, dass die Signalschatzer oder Signalfilter nur die Amplituden 
der Signale in einem transformierten Bereich beriicksichtigen; 

20. Ein Verfahren nach einem der vorangegangenen Anspriiche, dadurch 
gekennzeichnet, dass die Signalschatzer oder Signalfilter gemeinsam eine 
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Kostenfunktion minimieren; 

21. Ein Verfahren nach einem der vorangegangenen Anspriiche, dadurch ge- 
kennzeichnet, dass die Ausgangssignale der Signalschatzer oder Signalfilter 
gewichtet und gemittelt werden und die Gewichte aus den Wahrscheinlich- 
keiten ftir das Vorhandensein des Nutzsignals oder der Storsignale berechnet 
werden; 

22. Ein Verfahren nach einem der vorangegangenen Anspriiche, dadurch 
gekennzeichnet, dass das von Rauschen und Echos befreite Signal nach 
den Gleichungen 1-12 berechnet wird; 

23. Ein Verfahren nach einem der vorangegangenen Anspriiche, dadurch 
gekennzeichnet, dass das gleichzeitig akustische Echos und Rauschen un- 
terdriickt wird und die Kombinauon der Signalschatzer oder Signalfilter von 
der Aktivitat des nahen und des fernen Sprechers einer Freisprecheinrichtung 
abhangt. 
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Fig. 1: Vorrichtung zur Reduktion von Rausch- und Echostorungen mit Hilfe 
von N Signalschatzern oder Signalfiltern und einer Kombinationseinheit K. 
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Fig. 2: Vorrichtung zur gemeinsamen Reduktion akustischer Echos und Rau- 
schen. 
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Zusammenfassung 

Die Erfindung beschreibt ein Verfahren und eine Vorrichtung zur Unter- 
druckung oder Reduktion von Rauschen und/oder Echos in Sprach- oder 
Bildsignalen, das aus mehreren Signalschatzern oder Signalfiltern Si, 5 2 , 
5jv, und einer Kombinationseinheit K besteht. Die Kombinationseinheit er- 
laubt die Auswahl eines der geschatzten Signale oder die Kombination der 
Ausgangssignale der Signalschatzer oder Signalfilter zu einem einzigen ver- 
besserten Signal s{k). Gegeniiber dem Stand der Technik weist die Erfindung 
geringer Verzerrungen des Nutzsignals und natiirlichere, weniger stark fluk- 
tierende Reststorungen auf. 




x{k) 

Fig. 1: Vorrichtung zur Reduktion von Rausch- und Echostorungen mit Hilfe 
von N Signalschatzern oder Signalfiltern und einer Kombinationseinheit K. 
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